检索结果

Select

1. 多模态特征的越南语语音识别文本标点恢复

赖华, 孙童, 王文君, 余正涛, 高盛祥, 董凌

《计算机应用》唯一官方网站 2024, 44 (2): 418-423. DOI: 10.11772/j.issn.1001-9081.2023020231

摘要（101）

HTML （10）

PDF （3010KB）（40）

越南语语音识别系统输出的文本序列缺少标点符号，恢复识别文本标点有助于消除歧义，更易于阅读和理解。越南语语音识别文本中常出现破坏语义的错误音节，基于文本模态的标点恢复模型在识别带噪文本时存在标点预测不准确的问题。利用越南语语音中的语气停顿及声调变化指导模型对带噪文本作出正确的标点预测，提出多模态特征的越南语语音识别文本标点恢复方法，利用梅尔倒谱系数（MFCC）提取语音特征，利用预训练语言模型提取文本上下文特征，基于标签注意力机制实现语音与文本多模态特征融合，增强模型对越南语带噪文本上下文信息的学习能力。实验结果表明，相较于基于Transformer和BERT提取文本单一模态特征的标点恢复模型，所提方法在越南语数据集上精确率、召回率和F1值均至少提高10个百分点，验证了融合语音与文本特征对提升越南语语音识别带噪文本标点预测精确率的有效性。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

2. 融合双向依存自注意力机制的神经机器翻译

李治瑾, 赖华, 文永华, 高盛祥

《计算机应用》唯一官方网站 2022, 42 (12): 3679-3685. DOI: 10.11772/j.issn.1001-9081.2021101805

摘要（261）

HTML （13）

PDF （961KB）（120）

针对神经机器翻译中资源稀缺的问题，提出了一种基于双向依存自注意力机制（Bi-Dependency）的依存句法知识融合方法。首先，利用外部解析器对源句子解析得到依存解析数据；然后，将依存解析数据转化为父词位置向量和子词权重矩阵；最后，将依存知识融合到Transformer编码器的多头注意力机制上。利用Bi-Dependency，翻译模型可以同时对父词到子词、子词到父词两个方向的依存信息进行关注。双向翻译的实验结果表明，与Transformer模型相比，在富资源情况下，所提方法在汉-泰翻译上的BLEU值分别提升了1.07和0.86，在汉-英翻译上的BLEU值分别提升了0.79和0.68；在低资源情况下，所提方法在汉-泰翻译上的BLEU值分别提升了0.51和1.06，在汉-英翻译上的BLEU值分别提升了1.04和0.40。可见Bi-Dependency为模型提供了更丰富的依存信息，能够有效提升翻译性能。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

3. 融合单语语言模型的汉越伪平行语料生成

贾承勋, 赖华, 余正涛, 文永华, 于志强

计算机应用 2021, 41 (6): 1652-1658. DOI: 10.11772/j.issn.1001-9081.2020071017

摘要（332）

PDF （1333KB）（303）

神经机器翻译在资源丰富的语种上取得了良好的翻译效果，但是由于数据稀缺问题在汉语-越南语这类低资源语言对上的性能不佳。目前缓解该问题最有效的方法之一是利用现有资源生成伪平行数据。考虑到单语数据的可利用性，在回译方法的基础上，首先将利用大量单语数据训练的语言模型与神经机器翻译模型进行融合，然后在回译过程中通过语言模型融入语言特性，以此生成更规范质量更优的伪平行数据，最后将生成的语料添加到原始小规模语料中训练最终翻译模型。在汉越翻译任务上的实验结果表明，与普通的回译方法相比，通过融合语言模型生成的伪平行数据使汉越神经机器翻译的BLEU值提升了1.41个百分点。

参考文献 | 相关文章 | 多维度评价